智能论文笔记

On the visual analytic intelligence of neural networks

Stanisław Woźniak , Hlynur Jónsson , Giovanni Cherubini , Angeliki Pantazi , Evangelos Eleftheriou

分类：神经与进化计算

2022-09-28

视觉奇数任务被认为是对人类的普遍独立的分析智能测试。人工智能的进步导致了重要的突破，但是与人类在此类分析智能任务上竞争仍然具有挑战性，并且通常诉诸于非生物学上的架构。我们提出了一个具有生物学现实的系统，该系统从合成眼动运动中接收输入 - 扫视，并与结合新皮质神经元动力学的神经元一起处理它们。我们介绍了一个程序生成的视觉奇数数据集，以训练扩展常规关系网络和我们建议的系统的体系结构。两种方法都超过了人类的准确性，我们发现两者都具有相同的基本推理基本机制。最后，我们表明，具有生物学启发的网络可实现卓越的准确性，学习速度更快，所需的参数比常规网络更少。

translated by 谷歌翻译

Visual processing in context of reinforcement learning

Hlynur Davíð Hlynsson

分类：机器学习

2022-08-26

尽管深度强化学习（RL）最近取得了许多成功，但其方法仍然效率低下，这使得在数据方面解决了昂贵的许多问题。我们的目标是通过利用未标记的数据中的丰富监督信号来进行学习状态表示，以解决这一问题。本文介绍了三种不同的表示算法，可以访问传统RL算法使用的数据源的不同子集使用：（i）GRICA受到独立组件分析（ICA）的启发，并训练深层神经网络以输出统计独立的独立特征。输入。 Grica通过最大程度地减少每个功能与其他功能之间的相互信息来做到这一点。此外，格里卡仅需要未分类的环境状态。（ii）潜在表示预测（LARP）还需要更多的上下文：除了要求状态作为输入外，它还需要先前的状态和连接它们的动作。该方法通过预测当前状态和行动的环境的下一个状态来学习状态表示。预测器与图形搜索算法一起使用。（iii）重新培训通过训练深层神经网络来学习国家表示，以学习奖励功能的平滑版本。该表示形式用于预处理输入到深度RL，而奖励预测指标用于奖励成型。此方法仅需要环境中的状态奖励对学习表示表示。我们发现，每种方法都有其优势和缺点，并从我们的实验中得出结论，包括无监督的代表性学习在RL解决问题的管道中可以加快学习的速度。

translated by 谷歌翻译

HTML版本

Semi-self-supervised Automated ICD Coding

Hlynur D. Hlynsson , Steindór Ellertsson , Jón F. Daðason , Emil L. Sigurdsson , Hrafn Loftsson

分类：自然语言处理 | 机器学习 | (统计)机器学习

2022-05-20

临床文本注释（CTN）包含医生的推理过程，以非结构化的自由文本格式编写，他们检查和采访患者。近年来，已经发表了几项研究，这些研究为机器学习的实用性提供了证据，以预测CTN的医生诊断，这是一项称为ICD编码的任务。数据注释很耗时，尤其是在需要一定程度的专业化时，就像医疗数据一样。本文提出了一种以半自我监督的方式增强冰岛CTN的稀疏注释数据集的方法。我们在一小部分带注释的CTN上训练神经网络，并使用它从一组未通畅的CTN中提取临床特征。这些临床特征包括对医生可能会在患者咨询期间找到答案的大约一千个潜在问题的答案。然后，这些功能用于训练分类器以诊断某些类型的疾病。我们报告了对医生的三个数据可用性评估该数据增强方法的评估结果。我们的数据增强方法显示出显着的积极作用，当检查患者和诊断的临床特征时，这会减少。我们建议使用基于不包括考试或测试的临床特征做出决策的系统增强稀缺数据集的方法。

translated by 谷歌翻译

Unsupervised Single-shot Depth Estimation using Perceptual Reconstruction

Christoph Angermann , Matthias Schwab , Markus Haltmeier , Christian Laubichler , Steinbjörn Jónsson

分类：计算机视觉 | 机器学习

2022-01-28

实时估计实际对象深度是各种自主系统任务（例如3D重建，场景理解和状况评估）的重要模块。在机器学习的最后十年中，将深度学习方法的广泛部署到计算机视觉任务中产生了成功，从而成功地从简单的RGB模式中实现了现实的深度综合。这些模型大多数基于配对的RGB深度数据和/或视频序列和立体声图像的可用性。到目前为止，缺乏序列，立体声数据和RGB深度对使深度估计成为完全无监督的单图像转移问题，到目前为止几乎没有探索过。这项研究以生成神经网络领域的最新进展为基础，以建立完全无监督的单发深度估计。使用Wasserstein-1距离（一种新型的感知重建项和手工制作的图像过滤器）实现并同时优化了两个用于RGB至深度和深度RGB传输的发电机。我们使用工业表面深度数据以及德克萨斯州3D面部识别数据库，人类肖像的Celebamask-HQ数据库和记录人体深度的超现实数据集来全面评估模型。对于每个评估数据集，与最先进的单图像转移方法相比，提出的方法显示出深度准确性的显着提高。

translated by 谷歌翻译

Unpaired Single-Image Depth Synthesis with cycle-consistent Wasserstein GANs

Christoph Angermann , Adéla Moravová , Markus Haltmeier , Steinbjörn Jónsson , Christian Laubichler

分类：计算机视觉 | 机器学习

2021-03-31

实时估计实际环境深度是各种自主系统任务（例如本地化，障碍检测和姿势估计）的重要模块。在机器学习的最后十年中，将深度学习方法的广泛部署到计算机视觉任务中，从简单的RGB模式中产生了成功的方法，以实现现实的深度综合。尽管这些模型中的大多数都基于配对的深度数据或视频序列和立体声图像的可用性，但缺乏以无监督方式面对单像深度综合的方法。因此，在这项研究中，将生成神经网络领域的最新进步杠杆化以完全无监督的单像深度综合。更确切地说，使用Wasserstein-1距离实现了两个用于RGB至深度和深度RGB传输的周期符合发电机，并同时优化。为了确保所提出的方法的合理性，我们将模型应用于自称的工业数据集以及著名的NYU DEPTH V2数据集，从而可以与现有方法进行比较。在这项研究中，观察到的成功表明，在现实世界应用中，不成对的单像深度估计的潜力很高。

translated by 谷歌翻译

Surface Topography Characterization Using a Simple Optical Device and Artificial Neural Networks

Christoph Angermann , Markus Haltmeier , Christian Laubichler , Steinbjörn Jónsson , Matthias Schwab , Adéla Moravová , Constantin Kiesling , Martin Kober , Wolfgang Fimml

分类：计算机视觉

2021-03-15

用于量化大型内燃机的圆柱衬里的最先进的方法，需要拆卸和切割检查的衬里。接下来是基于实验室的高分辨率显微表面深度测量，该测量基于轴承载荷曲线（也称为Abbott-Firestone曲线），对磨损进行了定量评估。这种参考方法具有破坏性，耗时且昂贵。此处介绍的研究的目的是开发无损但可靠的方法来量化表面地形。提出了一个新型的机器学习框架，该框架允许预测代表衬里表面反射RGB图像的深度轮廓的轴承载荷曲线。这些图像可以使用简单的手持显微镜收集。涉及两个神经网络模块的联合深度学习方法也优化了表面粗糙度参数的预测质量。使用定制数据库对网络堆栈进行训练，该数据库包含422个完美对齐的深度轮廓和大型气体发动机衬里的反射图像对。观察到的方法的成功表明，其在服务过程中对发动机进行现场磨损评估的巨大潜力。

translated by 谷歌翻译